Καλώς ορίσατε στο dotNETZone.gr - Σύνδεση | Εγγραφή | Βοήθεια
σε

 

Αρχική σελίδα Ιστολόγια Συζητήσεις Εκθέσεις Φωτογραφιών Αρχειοθήκες

Html Parser

Îåêßíçóå áðü ôï ìÝëïò leukonas. Τελευταία δημοσίευση από το μέλος leukonas στις 14-12-2010, 12:32. Υπάρχουν 3 απαντήσεις.
Ταξινόμηση Δημοσιεύσεων: Προηγούμενο Επόμενο
  •  08-12-2010, 02:16 61370

    Html Parser

    Καλησπέρα,

    για άλλη μια φορά χρειάζομαι τα φώτα σας και τισ συμβουλές σας.Θέλω-προσπαθώ να φτιάξω μια απλή μηχανή αναζήτησης η οποία θα ψάχνει σε συγκεκριμένα site κάποιες λέξεις κλειδία.Αυτο που χρειάζομαι είναι ένας Html parser απο ότι φαντάζομαι.Η ανάπτυξη του εργαλείου θα γίνει σε c#.Εχετε να προτείνεται κάποιον parser?Εχω δει αυτόν και αυτόν αλλά επειδή είναι κάτι που πρώτη φορά ασχολούμαι δεν ξέρω τι να προσέξω και τι να ψάξω.Εχει δουλέψει κανείς με κάποιον απο τους δύο?Υπάρχει κάτι καλύτερο?Η εφαρμογή δεν με πειράζει αν θα είναι web η windows.Κάθε γνώμη - συμβουλή ευπρόσδεκτη.

    Ευχαριστώ

    Δημοσίευση στην κατηγορία:
  •  09-12-2010, 08:23 61399 σε απάντηση της 61370

    Απ: Html Parser

    Δες το HTML Agility Pack στο http://htmlagilitypack.codeplex.com/


    http://nikosbaxevanis.com
  •  14-12-2010, 09:42 61605 σε απάντηση της 61370

    Απ: Html Parser

    Εγώ έχω δουλέψει για ένα αρκετά μεγάλο και βαρύ project ενός crawler που θα μπορούσε να διαβάζει το οτιδήποτε από το web. Φαντάσου κάτι σα το skroutz και τα συναφή. Δοκιμάσαμε δυο parsers ton HtmlAgility αλλά και τον Majestic12. Αν διαβάσεις τα documentations θα καταλάβεις εύκολα οτι σαφώς ταχύτερος είναι ο Majestic και στο εγγυώμαι εγώ, ότι είναι με διαφορά. 'Αλλωστε είναι λογικό κάτι που φτιάχνει dom σε xml να αργεί αρκετά. Από την άλλη αν δε σε νοιάζει η ταχύτητα θα σου πρότεινα να δουλέψεις με τον HtmlAgility γιατί το το API του είναι σαφώς πιο εύχρηστο. Αν θες μπορώ να σου δώσω ένα setup κώδικα για να ξεκινήσεις. Δυστυχώς δε μπορώ να σου δώσω πιο πολλά γιατι ανήκει σε εταιρεία το project. 

    Εν κατακλείδι: Ταχύτητα -> Μajestic
         Ευχρηστία -> Agility

    softwarebytes.blogspot.com
  •  14-12-2010, 12:32 61609 σε απάντηση της 61605

    Απ: Html Parser

    Καλημέρα και σε ευχαριστώ για το ενδιαφέρον και την απάντηση σου.Αυτη την στιγμή δοκιμάζω τον Agility.Φυσικά με ενδιαφέρει αρκετά η ταχύτητα και ίσως τελικά να δοκιμάσω και τον Majestic ώστε να έχω μια πιο ολοκληρωμένη άποψη.Θα με ενδιέφερε φυσικά να μπορεις να μου στείλεις ένα setup κώδικα ώστε να πάρω και απο εκει μια ιδέα.Ευχαριστώ και πάλι.
Προβολή Τροφοδοσίας RSS με μορφή XML
Με χρήση του Community Server (Commercial Edition), από την Telligent Systems